sr c= 
原始 小 球 藻 4P2 转 录 因 子 的 生物 信息 学 分 析 
付 春 2 ， 唐 易 22， 江 纳 3， 杨 瑶 君 " 
(1. 竹 类 病 虫 防 控 与 资源 开发 四 川 省 重点 实验 室 乐山 师范 学 院 , 四 川 乐山 , 614000; 2. 乐山 师范 学 院 生 
命 科 学 学 院 ， 四 川 乐山 ，614000; 3. 乐山 师范 学 院 数学 与 信息 科学 学 院 ， 四 川 乐山 ，614000) 


摘要 :本 研究 对 原始 小 球 藻 4P2 基 因 家 族 的 蛋白 成 员 进 行 了 详细 的 生物 信息 学 预测 和 分 析 ， 
为 进一步 研究 原始 小 球 藻 4P2 转 录 因 子 的 功能 提供 一 定 的 参考 依据 。 利 用 PrtoParam、Pfam 
3.20、Protscale 等 在 线 工 具 分 析 原 始 小 球 藻 4P2 家 族 所 包含 的 8 个 蛋白 成 员 。 结 果 表 明 : 该 家 
族 成 员 含 有 的 氨基 酸 数 为 247 (XP_011395646.1) 到 715 (XP_011401904.1)， 理 论 等 电 点 最 大 
为 9.39 (XP_011396011.1)、 最 小 为 5.81 (XP_011398158.1); 家 族 中 各 个 成 员 所 含有 的 保守 结 
构 域 的 位 置 和 数量 都 各 不 相同 ; 所 有 蛋白 成 员 均 无 信号 肽 ， 均 不 包含 跨 膜 螺 旋 ， 不 具有 跨 
膜 区 域 ， 蛋 白 成 员 中 最 大 亲 水 性 值 为 -3.222 (XP_011398158.1) ， 最 大 玻 水 性 值 为 2.333 
CXP_011401904.1D)， 且 所 有 成 员 的 平均 杀 玻 水 性 值 均 小 于 0; 成 员 中 有 多 个 磷酸 化 位 点 值 远 
超标 准 值 0.5， 最 大 磷酸 化 位 点 值 为 0.998;， 该 基因 家 族 的 蛋白 成 员 二 级 结构 的 组 分 含量 从 大 
到 小 排序 均 为 无 规则 卷曲 >a- 螺 旋 > 延 伸 链 >B- 转 角 ， 推 测 a- 螺 旋 和 无 规则 卷曲 是 其 二 级 结构 
的 主要 方式 ， 延 伸 链 和 B- 转 角 则 分 散在 所 有 蛋白 成 员 的 氨基 酸 链 中 ;所 有 成 员 的 三 级 结构 
分 析 中 均 能 观察 到 a- 螺 旋 、B- 折 钱 、B- 转 角 以 及 N 端 和 C 端 ， 系统 进化 分 析 结 果 表 明 ， 在 其 
余 15 个 物种 中 ， 与 原始 小 球 藻 亲缘 关系 最 远 的 是 金牛 介 球 菌 (Ostreococcus tauri)， 亲 缘 关 系 
最 为 接近 的 是 小 球 荡 (Chlorella variabilis NC64A) 和 螺旋 人物 子 虫 (Helicosporidium)， 较 为 接近 
的 是 苦 参 3 号 (Picochlorum sp. SENEW3)。 该 研究 较 系 统 地 分 析 了 原始 小 球 藻 AP2 和 蛋白 家 族 的 
理化 特性 、 保 守 基 序 及 系统 进化 关系 ,为 进一步 研究 原始 小 球 藻 4P2 转 录 因 子 功能 和 互 作 关 
系 提供 一 定 的 参考 依据 。 
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protothecoides are predicted and analyzed in detail by bioinformatics, which provided some ref- 
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erence for further study on the function of 4P2 transcription factor in Auxenochlorella 
protothecoides. Eight protein members of the AP2 family of Auxenochlorella protothecoides are 
analyzed by online tools Such as PrtoParam, Pfam 3.20 and Protscale and so on. The results show 
that amino acids numbers of the family members are 247(XP_011395646.1) to 
715(XP_011401904.1). The maximum theoretical isoelectric point is 9.39(XP_011396011.1), and 
the minimum is 5.81(XP_011398158.1). The positions and numbers of conserved domains in 
each member of the family are different; all protein members have no Signal peptide; do not con- 
tain transmembrane helix, do not have transmembrane region; The maximum hydrophilicity value 
of the protein members is -3.222(XP_011398158.1), and the maximum hydrophobicity value is 
2.333(XP_011401904.1), and the average hydrophilicity/hydrophobicity value of all members is 
less than 0; The values of many phosphorylation sites in the members were far beyond the stand- 
ard value of 0.5, and the maximum value of phosphorylation site is 0.998. The component content 
of secondary structures of protein members in the gene family is arranged in the order of ran- 
dom coil > alpha-helix > extended strand > beta-turn. It is speculated that alpha-helix and random 
coil are the main modes of its Secondary structure, while extended strand and beta-turn are dis- 
persed in the amino acid chain of all protein members.Alpha-helix, beta-sheet, beta-turn, 
N-terminal and C-terminal were observed in the tertiary structure of all members. Phylogenetic 
analysis showed that Ostreococcus tauri is the most distant relative to the Auxenochlorella 
protothecoides, The closest relatives are Chlorella variabilis NC64A and Helicosporidium, and 
the next closest relatives are Picochlorum sp. SENEW3 among the other 13 species.This Study 
systematically analyzed the physicochemical properties, conserved motifs and phylogenetic rela- 
tionships of AP2 protein family in Auxenochlorella protothecoides. It provided a reference for 
further study on the function and interaction of AP2 transcription factors in Auxenochlorella 
protothecoides. 
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由 于 化 石 能 源 的 枯竭， 急需 在 生物 能 源 方面 得 到 突破 ( 侯 丽 垦 ，2016)。 微 藻类 生物 主要 
于 生物 柴油 的 研究 ( 夏 金 兰 等 ，2009)， 而 原始 小 球 藻 (Auxenochlorella protothecoides) 是 一 
种 生长 周期 短 ， 易 培养 ， 可 利用 光 能 光合 作用 进行 自 养 ， 又 能 利用 有 机 碳 源 进行 异 养 培 养 
积累 油脂 ， 高 附加 值 产物 丰富 的 微 藻 ( 汪 桂 林 等 ,2013)， 它 被 认为 是 生物 柴油 最 具 潜 力 的 原 
料 之 一 ( 桂 小 华 ，2017)。 原 始 小 球 攻 生长 周期 短 、 适 应 性 强 、 光 合 效率 和 含油 量 高 、 单 位 面 
积 产 量 高 ， 现 已 被 作为 生物 柴油 方面 主要 能 源 藻 种 加 以 研究 开发 ( 汪 桂 林 等 ,2013)。 目 前 对 
藻类 的 4P2 转 录 因 子 研究 较 少 。 

4P2 是 植物 所 特有 的 转录 因子 家 族 之 一 , 起 到 调控 植物 生长 发 育 的 转录 以 及 逆境 胁迫 等 
生理 过 程 的 作用 ( 栗 丽 和 余 少 明 ，2016)。1994 年 Jofuku(Jofuku et al., 1994) 等 从 模式 植物 拟 南 
芥 (Arabidopsis thaliana) 中 分 离 了 第 一 个 AP2 基 因 , 且 该 基因 与 花 发 育 有 关 ( 张 计 育 等 , 2012)， 
其 后 又 在 原核 生物 和 蓝藻 中 发 现 了 相同 的 转录 因子 (张扬 等 ，2018; Wessler 2005)， 证 实 该 
转录 因子 不 止 只 存在 于 植物 中 。 在 不 同 的 植物 中 含有 的 AP2/ERF 类 转录 因子 基因 家 族 成 员 
数量 是 不 同 的 (Riccardo Velasco et al., 2010)， 转 录 因 子 AP2/ERF 主 要 特征 是 具有 高 度 保守 的 
约 60~70 个 氨基 酸 组 成 的 AP2 结 构 域 ( 闻 可 心 和 刘 雪 梅 , 2010), 这 是 植物 转录 因子 家 族 之 一 ， 
家 族 成 员 均 包含 保守 AP2 结 构 域 ,人 们 根据 保守 结构 域 的 数量 和 识别 成 员 的 不 同 , 通常 情况 
下 ， 将 4AP2/ERF 家 族 划 分 为 不 同 的 4 个 转录 因子 亚 家 族 ， 分别 是 : 4P2，ERF，DREBP，R4V 
和 单独 成 员 Soloist(Zhuang et al., 2008; 张 麒 等 ，2018)。 转 录 因 子 4P2 基 因 家 族 在 植物 生长 
发 育 中 起 很 大 的 作用 ， 它 能 调控 植物 的 细胞 周期 、 生 长 发 育 以 及 生物 和 非 生 物 胁迫 相关 基 
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因 的 表达 ( 庄 静 等 ，2008; 陈 苦 ，2011; 吴 丽 娟 等 ，2016; 郭 翡 等 ，2017)， 也 能 调控 自身 生 
殖 器 官 ( 花 、 胚 珠 和 种 子 ) 的 生长 发 育 ( 赵 利 锋 和 柴 团 炮 ，2008; 张 妍 和 孙 丰 宾 ，2011; 王 莉 
莉 ，2016)， 而 且 与 其 他 因子 相互 协作 ， 参 与 到 复杂 的 花 发 育 调控 网 络 ( 刘 杨 ，2009)。 虽 然 
关于 藻类 4P2 基 因 家 族 的 研究 比较 多 ,但 是 未 见 关 于 原始 小 球 菠 4P2 转 录 因 子 的 生物 信息 学 
分 析 的 报道 。 

本 研究 通过 分 析 原 始 小 球 菠 的 4P2 转 录 因 子 编码 蛋白 的 理化 特性 、 亲 下 水 性 、 跨 膜 域 、 
保守 结构 域 、 保 守 基 序 、 亚 细胞 定位 以 及 4P2 转 录 因 子 在 不 同 物种 中 的 进化 起 源 关系 ， 为 进 

步 研究 原始 小 球 菠 4P2 基 因 家 族 的 生物 学 功能 黄 定 一 定 的 理论 依据 。 


1 材料 与 方法 


1.1 材料 

从 plantTFDB (http: //planttfdb.cbi.pku.edu.cn/) 数 据 库 中 下 载 原 始 小 球 藻 (Auxenochlorella 
protothecoides)AP2 基 因 家 族 中 所 有 成 员 的 蛋白 序列 和 岩 藻 (Bathycoccus prasinoy)、 莱 英 衣 党 
(Chlamydomonas reinhardtii’)、 小 球 党 (Chlorella variabilis NC64A)、 胶 球 藻 (Coccomyxa 
subellipsoidea C-169)、 盐 生 杜 氏 藻 (Dunaliella salina)、 胸 状 檀 薄 (Gonium pectorale)、 螺 旋 抱 
子 虫 (Helicosporidium)、 细 小 微 胞 藻 (Micromonas pusilla CCMP1545)、 微 单 胞 藻 (Micromonas 
sp RCC299)、 深 蓝 单 壳 颖 荡 (Monoraphidium neglectum)、 和 透明 介 球 菌 (Ostreococcus 
lIucimarinus)、 介 球菌 (Ostreococcus sp. RCC809)、 人 金牛 介 球菌 (Ostreococcus tauri)、 苦 参 3 号 
(Picochlorum sp. SENEW3) 以 及 团 灌 (Volvox carteri) 等 物种 的 AP2 成 员 和 蛋白 序列 。 对 原始 小 球 
藻 的 AP2 所 有 成 员 的 蛋白质 序 列 进行 详细 的 生物 信息 学 分 析 ， 且 将 原始 小 球 薄 与 岩 落 
(Bathycoccus prasinos) 等 16 个 物种 AP2 和 蛋白 进行 同 源 序列 比 对 分 析 并 构建 进化 树 ， 探 究 16 个 
物种 间 的 进化 起 源 关 系 。 


1.2 方法 
1.2.1 AP2 转 录 因 子 基因 的 蛋白 成 员 的 一 级 结构 和 理化 性 质 分 析 

利用 在 线程 序 PrtoParam (https:Wweb.expasy.ore/protparam/) 对 原始 小 球 菠 4P2 转 录 因 子 
蛋白 成 员 的 一 级 结构 和 理化 性 质 进行 分 析 , 包括 了 蛋白 成 员 氨 基 酸 数目 、 理 论 pI、 分 子 量 、 
带 负 电 氨 基 酸 残 基 、 带 正 电 氨 基 酸 残 基 、 不 稳定 系数 、 脂 肪 指数 、 亲 下 水 性 、 分 子 式 、 原 
子 总 数 等 方面 ( 韩 长 志 和 王 娟 ，2016)。 
通过 在 线程 序 Cell-PLoc 2.0 (http://www.csbio.sjtu.edu.cn/bioinf/ Cell-PLoc-2/) 对 原始 小 
球 藻 4P2 转 录 因 子 的 8 个 蛋白 成 员 进 行 亚 细胞 定位 点 分 析 ( 徐 志 军 等 ，2019)， 参 数 设置 : 物 
种 选择 为 真 核 生 物 。 
1.2.2 氨基 酸 的 保守 结构 域 、 跨 膜 结构 及 信号 肽 分 析 

利用 Pfam 3.20 (http:/pfam.xfam.org/) 对 原始 小 球 藻 的 蛋白 成 员 进 行 保守 结构 域 预测 ( 张 
海燕 等 ，2013)， 统 计 分 析 和 蛋白 成 员 氨 基 酸 保守 结构 域 的 个 数 及 位 置 。 

在 TMHMM Severv.2.0 (http:/www.cbs.dtu.dk/ services/TMHMM/) 在 线程 序 中 输入 AP2 转 
录 因 子 基因 和 蛋白 成 员 ， 分析 跨 膜 螺 旋 的 数量 以 及 跨 膜 结构 的 区 域 ， 确 定 基因 和 蛋白 成 员 是 否 
有 具有 跨 膜 区 域 ， 判 断 是 否 为 跨 膜 蛋白 。 

利用 SignaIP3.0 Server(http://www.cbs.dtu.dk/services/SignalP-3.0/) 对 原始 小 球 藻 和 蛋白 成 
员 进行 信号 肽 分 析 ( 柳 燕 等 ，2017)。 
1.2.3 氨基 酸 的 亲 下 水 性 和 磷酸 化 位 点 预测 分 析 

利用 Protscale (https://web.expasy.org/protscale/) 在 线 工 具 , 对 该 转录 因子 基因 重 
行 杀 疏 水 性 预测 分 析 ， 确 定 最 大 杀 水 值 和 最 大 琉 水 值 及 其 相对 应 的 位 置 ， 判 断 该 基 


上 淋 丁 
| 
山 


成 员 为 杀 水 蛋白 还 是 玻 水 蛋 E 
使 用 NetPhos 3.1 Server i //www.cbs.dtu.dk/services/NetPhos/) 在 线程 序 对 转录 因子 基 
因 和 蛋白 成 员 进行 潜在 磷酸 化 位 点 预测 分 析 ， 并 统计 磷酸 化 位 点 种 类 和 数量 。 
1.2.4 编码 蛋白 的 二 级 结构 和 三 级 结构 预测 分 析 
利用 SOPMA (Chttps:/npsa-prabi.ibcp.frcgi-bin/npsa_automat.pl?page=npsa_sopma.html) 在 
线程 序 对 该 转录 因子 蛋白 成 员 的 二 级 结构 进行 预测 分 析 ， 统 计 该 蛋白 成 员 中 a- 螺 旋 、 无 规 
则 卷曲 、 延 伸 链 和 PB- 转角 相对 应 的 百分比 。 
通过 同 源 建 模 法 ， 利 用 SWISS-MODEL (https://www.swissmodel.expasy.org/) 在 线 工具 
(Schwede T, et al., 2003)， 对 该 蛋白 家 族 的 三 级 结构 进行 预测 分 析 ， 确 定 其 三 级 结构 的 组 成 
和 构象 变化 。 
1.2.5 保守 基 序 分 析 

利用 MEME7.0 (http://meme-suite.org/) 在 线 工具 对 原始 小 球 汇 AP2 转 录 因 子 的 蛋白 成 员 
进行 保守 基 序 motif 分 析 ， 参 数 设 置 motif 数 目 为 10 个 ， 其 余 参 数 设 为 默认 值 。 
1.2.6 同 源 性 分 析 及 进化 树 分 析 

在 plantTFDB (https://web.expasy.org/protparam/) 在 线程 序 中 ， 将 原始 小 球 藻 的 8 个 成 员 
序列 , 分别 和 同 为 绿 菠 门下 的 其 余 15 个 物种 4P2 基因 家 族 的 蛋白 成 员 进 行 同 源 序列 的 对 比 ， 
找到 相对 应 的 其 余 物 种 的 同 源 序列 ， 并 归纳 。 

利用 MEGA7.0 (Tamura K, et al., 2011) 软 件 中 的 ClustalW 功能 对 原始 小 球 藻 AP2 转录 
因子 所 有 成 员 和 蛋白 对 应 的 序列 组 ， 分 别 进行 多 重 比 对 并 邻接 法 构建 其 系统 进化 树 ( 李 建 伏 等 
2008), 对 比 8 个 蛋白 成 员 的 同 源 序列 的 差距 , 判断 各 个 物种 与 原始 小 球 藻 之 间 的 杀 缘 关系 。 

结果 与 分 析 

2.14P2 转 录 因 子 基因 成 员 的 一 级 结构 和 理化 性 质 分 析 

原始 小 球 藻 4P2 转 录 因 子 和 蛋 白 家 族 含有 8 个 成 员 , 该 蛋白 家 族 氨 基 酸 数目 范围 为 247~715; 
等 电 点 范围 为 5.81(XP_011398158.1)~9.39CXP_011396011.1)， 理 论 等 电位 点 >7 为 碱 性 氨基 酸 : 
XP_011395646.1、XP_011396011.1、XP_011400319.1 和 XP_011401904.1， 理 论 等 电位 点 <7 
为 酸性 氨基 酸 : XP_011396127.1、XP_011401790.1、XP_011400550.1 和 XP_011398158.1; 
该 家 族 成 员 带 负电 氨基 酸 残 基数 目 范 围 为 26(XP_011395646.1)~85(XP_011401790.1); 该 家 
族 成 员 带 正点 氨基 酸 残 基数 目 范 围 为 26(XP_011398158.1)~81(XP_011401790.1); 不 稳定 指 
数 均 大 于 40( 不 稳定 系数 <40 时 稳定 )( 夏 巧 玉 ，2007)， 推 断 为 不 稳定 蛋白 ， 脂 肪 指数 范围 为 
58.87(XP_011401790.1)~74.26(XP_011400550.1); 原始 小 球 藻 AP2 和 蛋白 成 员 进行 的 亚 细 胞 定 
位 分 析 中 显示 该 家 族 全 部 成 员 的 亚 细 胞 都 可 定位 于 细胞 质 (Cytoplasm),， 其 中 4 个 蛋白 成 员 成 
员 : XP_011396011.1、XP_011400319.1、XP_011401790.1 和 XP_011398158.1 的 亚 细 胞 只 定 
位 于 细胞 质 ( 表 1)。 通 过 和 氨基酸 组 成 分 析 可 知 ， 在 所 有 和 蛋白 成 员 中 ， 除 了 XP_011396011.1( 氨 
基 酸 的 最 大 含量 为 甘氨酸 -Gly-15.80%) 和 XP_011398158.1( 氨 基 酸 的 最 大 含量 为 亮 氮 酸 
-Leu-11.10%) 两 个 蛋白 家 族 成 员外 ， 其 余 六 个 蛋白 家 族 成 员 含量 最 高 的 氨基 酸 均 为 两 氮 酸 
(Ala)， 丙 氨 酸 含量 最 高 的 成 员 为 XP_011400550.1(Ala19.70%)， 含 有 丙 氨 酸 数 为 60， 丙 氨 酸 
含量 最 低 的 成 员 为 XP_011400319.1(Alal1.2%)， 含 有 丙 氨 酸 数 为 38( 图 1)。 


表 1 原始 小 球 藻 AP2 和 蛋白 的 理化 特性 


Table 1 Physical and chemical properties of AP2 protein in Auxenochlorella protothecoides 


氨基 酸 数 分 子 量 ”理化 特性 


Number of Molecu- Physicochemical property 


蛋白 ID 


Protein ID 


amino acids lar 理论 pI 带 负 电 带 正 电 不 稳定 指数 脂肪 指数 亚 细 胞 定位 
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weight 残 基 残 基 


Theoretical (Asp +(Arg +JInstability Aliphatic Subcellular localiza- 


pl Glu) Lys) index index tion 

细胞 质 ， 细 胞 外 
XP_011395646.1 247 27377.91 8.98 26 31 66.10 70.89 

Cytoplasm, extracell 

细胞 质 
XP_011396011.1 361 37242.76 9.39 32 41 46.47 66.95 

Cytoplasm 

细胞 质 ， 细 胞 外 
XP_011396127.1 375 40364.66 6.08 42 37 49.28 64.21 

Cytoplasm, extracell 

细胞 质 
XP_011400319.1 339 36701.84 8.83 39 42 74.47 63.45 

Cytoplasm 

细胞 质 
XP_011401790.1 682 71540.98 6.37 85 81 42.67 58.87 

Cytoplasm 

细胞 质 ， 细 胞 核 
XP_011401904.1 715 74708.18 7.86 68 69 58.52 62.81 

Cytoplasm, nucleus 

细胞 质 ， 细 胞 外 
XP_011400550.1 305 32414.34 6.34 34 29 55.92 74.26 

Cytoplasm, extracell 

细胞 质 
XP_011398158.1 324 34742.98 5.81 36 26 47.43 70.9 

Cytoplasm 


二 < 


主 : (Asp+Glu) 为 带 负 电荷 的 残 基 总 数 ，(Arg+Lys) 为 带 正 电荷 的 残 基 总数 。 
Note: (Asp+Glu) is the total of the residue of the negatively charged; (Arg+Lys) is the total of the residue of the 


positive charged. 


XP_011395646.1 XP_011396011.1 XP_011396127.1 XP_011400319.1 


wm Ala (A) 
mm Arg (R) 
m Asn (N) 
[7 By ~ m Cys (C) 
i SEE 和 pm 用 w Gin (OQ) 
mm Glu (E) 
wm His (H) 
mu lle (|) 
mLeu (Ll) 
mm Lys (K) 
XP_011401790.1 XP_011401904.1 XP_011400550.1 XP_011398158.1 Twi™ 


m Phe (F) 
m Pro (P) 
w Ser (5) 
mw Thr (T) 
mw Trp (W) 
m Tyr (Y) 
mm Val (V) 


; V. 纺 氮 酸 。 


A. Alanine; R. Arginine; N. Apsaragine; D. Apsartic acid; C. Cystine; Q. Glutarnine; E. Glutamicacid; G. Glycine; 


H. Histidine; I. Isoleucine; L. Leucine; K. Lysine; M. Methionine; F. Phenylalanine; P. Proline; S. Serine; 
T. Threonine; W. Tryptophan; Y. Tyrosine; V. Valine. 
图 1 原始 小 球 藻 AP2 和 蛋白 质 的 氨基 酸 组 成 


Fig.1 Amino acid composition of AP2 protein from Auxenochlorella protothecoides 


2.2 氮 基 酸 保守 结构 域 、 信 和 号 肽 和 器 膜 域 结构 分 析 
蛋白 成 员 中 ， 不 同 基因 和 蛋白 成 员 的 AP2 保 守 结 构 域 的 数量 和 位 置 各 不 相同 ， 其 中 
XP_011396127.1(K3s-Lo6,R118-Y178,F200-E260) 和 XP_011401790.1(Sey-Di0s, W188-Ar33,S264-E322) 
两 个 成 员 各 含 3 个 保守 结构 域 ， 而 XP_011398158.1(Yso-E111) 和 XP_011400550.1(Y2o0-Eo6) 两 个 
成 员 中 各 自 都 只 含有 1 个 氨基 酸 保守 结构 域 ;， 余下 的 XP_011395646.1(Y59-TiitFi5li-A>o7)、 
XP_011396011.1(Q160-Az33,S264-G322)、 XP_011400319.1(K174-Ey35, Y26s-E326) XP_011401904.1 


(Qzsg-E333,F363-Ea26)4 个 成 员 ， 均 包含 2 个 保守 结构 域 。 保 守 结 构 域 跨度 最 大 成 员 是 
XP_011401904.1(Q2ss-Ea33)， 其 氨基 酸 数 量 达 75 个 ， 和 蛋白 成 员 XP_0114017 
守 结 构 域 跨度 最 小 ， 其 氨基 酸 数量 为 37 个 ( 表 2， 
同 , 但 却 有 相似 ， 如 XP_011395646.1、XP_011400319.1 和 XP_011401904.1 这 3 个 成 员 就 含有 
相似 之 处 (图 2)。 信号 肘 分 析 表 明 原 始 小 球 藻 AP2 
TMHMM 跨 膜 域 结构 分 析 表 明 原 始 小 球 菠 所 有 


非 跨 膜 和 蛋白 。 


i 


Re 
这 地 
L 


均 不 存在 信号 肽 , 属于 非 分 泌 型 


册 


成 员 均 不 含 跨 膜 结构 域 ， 推 


表 2 原始 小 球 党 AP2 和 蛋白 保守 结构 域 数量 和 位 置 


Table 2 Number and location of conserved domains of AP2 protein in Auxenochlorella 


protothecoides 
PE AP2 保 守 结 构 域 个 数 保守 结构 域 的 位 置 
; Number of conservative 
Protein ID Conservative domain location 


structural domains in AP2 


XP_011395646.1 
XP_011396011.1 
XP_011396127.1 


XP_011400319.1 


XP_011401790.1 
XP_011401904.1 
XP_011400550.1 


XP 011398158.1 


2 


2 


3 


Yso-T! 1 bP15 1-A2o7 

Q 169-A233,9 264-G322 
Ks-LoG6,R1 18-Y 178,F200-E260 
K174-E23s, Y265-E326 

Ser-D 104, WV 1 88-A233,5 264-E322 
@Q258-E333,F363-E426 

Y29-Eo6 


Ys0-E 111 


90.1(Sey-Dio4) 中 保 
图 2)。 各 个 蛋白 成 员 的 位 置 和 跨度 都 各 不 相 


硬 白 。 


毛重 


ea 


断 该 蛋白 为 
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1 50 i100 150 200 247 


XP_011395646.1 


DNA binding site DNA binding site Bh Mh Ma 
B AP2 superfamily 
1 So 100 150 200 250 S00 350 361 
EE 
DNA binding site 由 MA DNA binding site Ml A MA 


AP2 superfamil RAP2 superfanily 


1 50 100 150 200 250 S00 350 375 
XP_011396127.1 
DNA binding site DNA binding site 


AP2 superfamily PP2 superfamily AP2 superfamily 


1 50 100 150 200 250 S00 339 


XP_011400319.1| 


DNA binding site Dh lh Mh 


AP2 superfamil 
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XP_011401790.1 
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XP_011401904.1 
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XP_011400550.1 
NA binding site MabhA Dh hh 


AP2 superfamily 


1 50 100 150 200 250 S00 324 


XP_011398158. 


NA binding site 


图 2 原始 小 球 藻 AP2 和 蛋白 氨基 酸 保守 域 预 测 


Fig.2 Prediction of amino acids conservative domain of AP2 protein in Auxenochlorella 


protothecoides 


2.3 氨基 酸 亲 政 水 性 预测 分 析 


在 这 8 个 重 白 家 族 成 员 中 ,氨基 酸 疏 水 性 的 最 大 值 达到 了 2.333 (XP_011401904.1D)， 玻 水 
性 最 小 值 为 1.389 (XP_011398158.1); 氨基 酸 亲 水 性 最 大 值 达 到 了 -3.222 (XP_011398158.1)， 
亲 水 性 最 小 值 为 -2.378 (XP_011396127.1)。 该 家 族 成 员 XP_011401904.1 的 氨基 酸 杀 下水 性 差 


值 最 大 ， 达 到 了 5.455， 对 应 平均 杀 水 指数 (GRAVY) 为 -0.3945， 其 第 316 位 氨基 酸 表 现 最 大 
下 水 性 为 2.333， 第 584、585、586、588、589 位 氨基 酸 均 表现 最 大 亲 水 性 为 3.122。 所 有 的 
AP2 和 蛋白 家 族 成 员 中 的 平均 亲 水 指数 均 小 于 0， 所 以 该 蛋白 亲 水 性 更 强 ， 推 断 该 原始 小 球 藻 


4P2 转 录 因 子 蛋白 为 杀 水 性 恒 白 ( 表 3， 图 3)。 坐 标 图 中 ， 纵 坐标 显示 氨基 酸 标 度 值 ， 了 


示 朴 水 ， 负 值 表示 杀 水 ， 横 坐标 显示 氨基 酸 序列 位 置 (图 3) ( 杨 衣 ，2015) 。 
表 3 ”原始 小 球 藻 AP2 蛋 白 的 亲 玻 水 性 
Table 3 Hydrophilicity of AP2 protein from Auxenochlorella protothecoides 


E 值 表 


亲 水 性 Hydrophilicity 下 e 水 性 Hydrophobicity 

生日 ID 一 i 
数值 位 置 数值 位 

Protein ID 

Value Position Value Position 
XP_011395646.1 -2.667 21 1.878 100 
XP_011396011.1 -2.500 179 1.444 332 
XP_011396127.1 -2.378 48 1.822 267 
XP_011400319.1 -2.489 231 2.044 62 
XP_011401790.1 -2.967 654 1.800 16 


XP_011401904.1 -3.122 586 2.333 316 
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1.789 127 
1.389 117 


ProtScale output for user_sequence 


2 一 
亲疏 水 性 Hphob,Kyte&Doolittle 
2 
§ 
oo 
nn 
姻 了 
EE 
EE i R 1 R 
50 100 150 200 
A 位 置 Position (AA) 
ProtScale output for user_sequence 
2 
亲 玻 水 性 Hphob,/Kyts&Doolitle 一 
1.5 
1 
0.5 | 
5 。 ] 
已 
nn 
芭 -0.5 了 
耕 1 
入 
省 
2.5 | HE Ws ES EE 
50 100 150 200 250 300 350 
C 位 置 Position (AA) 
ProtScale output for user_sequence 
2 * 
15 亲 玻 水 性 HphobJKyte&Doolittle 
1 上 | 
0.5 上 
2 0 
品 05 | 
1r i | 
-1.5 上 
章 : 志 
2.5 上 
-3 
0 100 200 300 400 500 600 
E 位 置 Position (AA) 
ProtScale output for user_sequence 
订正 水 性 HphobJKYIe&Doalits | 
2 
3 
nn 
| 
冰 
3 i i . ， 2 Re 
50 100 150 200 250 300 
G 位 置 Position (AA) 


ProtScale output for user_sequence 


1.5 
亲 玻 水 性 Hphob,Kyte&Doolittle 
1 | 
0.5 ] 
20 
8 
办 -0.5 
姻 
将 -1 
1.5 
2 
2.5 
50 100 150 200 250 300 350 
B 位 置 Position (AA) 
i ProtScale output for user_sequence 
2 上 亲 玻 水 性 HphobVJKyte&Doolittle 


2 
2.5 L 2 1 A 2 1 
50 100 150 200 250 300 
D 位 置 Position (AA) 
ProtScale output for user_sequence 
3 
亲 朴 水 性 HphobJKyte&Doolitle 
2 上 
1 
2 or 
S 
多 1 
地 上 
EE 
二 上 
-3 二 
-4 
0 100 200 300 400 500 600 700 
F 位 置 Position (AA) 
ProtScale output for user_sequence 
1.5 ~ - 
亲政 水 性 HphobJKyte& Doolittle 
二 上 
0.5 上 
ot 
20.5 
a 
| 
1.5 上 
EE 
SE 
-2.5 上 
-上 
-3.5 1 1 1 RA 
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A. XP_011395646.1; B. XP_011396011.1; C. XP_011396127.1; D. XP_011400319.1; E. XP_011401790.1; F. 

XP_011401904.1; G. XP_011400550.1; H. XP_011398158.1. 
图 3 原始 小 球 藻 AP2 和 蛋白 家 族 的 亲 水 性 分 析 

Fig.3 Hydrophilicity analysis of AP2 protein family of Auxenochlorella protothecoides 


2.4 磷酸 化 位 点 分 析 


经 分 析 发 现 ， 在 闵 值 为 0.5 时 ,原始 小 球 藻 AP2 转 录 因 子 蛋 白 成 员 中 潜在 的 磷酸 化 位 点 最 


多 的 是 XP_011401790.1 (77)， 潜 在 磷酸 化 位 点 最 少 的 是 XP_011400550.1 (24)。 将 同 种 氨 
酸 对 比分 析 ， 在 整个 家 族 中 ， 潜 在 位 点 为 丝氨酸 (S) 数 量 最 多 的 是 XP_011401790.1， 达 到 了 
49 个 位 点 ,数量 最 少 的 是 XP_011395646.1 和 XP_011400550.1 两 个 成 员 ， 均 含有 17 个 位 点 ， 洪 
在 位 点 为 苏 氨 酸 (T) 数 量 最 多 的 是 XP_011401790.1， 达 到 了 24 个 位 点 ， 数 量 最 少 的 是 
XP_011400550.1， 仅 含有 4 个 位 点 ; 潜在 位 点 为 络 氨 酸 (Y) 数 量 最 多 的 是 XP_011396011.1 和 
XP_011401904.1， 都 达到 了 5， 数 量 最 少 的 是 XP_011398158.1， 仅 1 个 位 点 ( 表 4)。 在 第 4 个 分 
文 XP_011400319.1 中 ， 第 164 位 、 第 218 位 的 苏 氨 酸 ， 第 142 位 、 第 160 位 丝氨酸 以 及 第 268 位 
络 氨 酸 可 能 是 潜在 的 磷酸 化 位 点 ， 其 中 最 有 可 能 是 潜在 磷酸 化 位 点 的 是 第 142 位 和 第 160 位 
的 丝氨酸 ， 其 值 均 已 经 达到 了 0.998， 远 超 了 标准 值 0.5， 同 时 也 说 明 蛋 白质 可 能 通过 丝氨酸 
磷酸 化 位 点 来 实现 其 功能 的 调控 ( 表 4)。 
表 4 原始 小 球 藻 AP2 和 蛋白 家 族 的 磷酸 化 位 点 分 析 


Table 4 Phosphorylation site analysis of AP2 protein family in Auxenochlorella protothecoides 


蛋白 ID 氨基 酸 个 数 值 位 
Protein ID Amino acid Number Value Position 
_ XP_011395646.1 ”丝氨酸 Serine 17 0.998 59,60,72 
苏 氨 酸 Threonine 10 0.984 86 
络 氨 酸 Tyrosine 2 0.877 148 
XP_011396011.1 丝氨酸 Serine 21 0.997 214,290 
苏 氨 酸 Threonine 8 0.844 143 
络 氨 酸 Tyrosine 5 0.978 119 
XP_011396127.1 ”丝氨酸 Serine 26 0.997 239 
苏 氨 酸 Threonine 8 0.991 52 
络 氨 酸 Tyrosine 4 0.983 339 
XP_011400319.1 丝氨酸 Serine 29 0.998 142,160 
苏 氮 酸 Threonine 9 0.989 164,218 
络 氨 酸 Tyrosine 3 0.705 268 
XP_011401790.1 丝氨酸 Serine 49 0.998 305 
苏 氨 酸 Threonine ”24 0.965 683 
= 络 氨 酸 Tyrosine 4 0.951 677 
XP_011401904.1 丝氨酸 Serine 47 0.997 102,389 
苏 氨 酸 Threonine 19 0.995 205,241 
络 氨 酸 Tyrosine 5 0.895 366 
XP_011400550.1 丝氨酸 Serine 17 0.993 59,204,277 
苏 氨 酸 Threonine 4 0.664 45 
络 氨 酸 Tyrosine 3 0.984 217 
XP_011398158.1 ”丝氨酸 Serine 18 0.969 239 
苏 氨 酸 Threonine 11 0.954 64 
络 氨 酸 Tyrosine 1 0.514 166 


2.5 原始 小 球 菠 4P2 转 录 因 子 编码 蛋白 的 二 级 结构 和 三 级 结构 预测 分 析 

蛋白 质 的 二 级 结构 主要 是 指 蛋 白质 的 多 肽 链 中 有 规则 重复 的 构象 ( 曹 晨 , 2016)， 在 原 
台 小 球 藻 AP2 转录 因子 基因 和 蛋白 成 员 中 ， 二 级 结构 中 组 分 含量 从 大 到 小 排序 均 为 无 规则 卷 
上 >o- 螺 旋 > 延 伸 链 >B- 转 角 ， 其 中 无 规则 卷曲 和 o- 螺 旋 的 占 比 较 大 ， 推 测 其 空间 结构 较 小 ， 


民 
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且 受 到 侧 链 间 相 互 作用 较 大 的 影响 ( 王 月 ，2017)。 基 因 二 级 结构 组 分 中 a- 螺 旋 (Alpha helix) 
值 最 大 的 是 XP_011400550.1 成 员 成 员 ， 占 比 达 到 了 40.00%，o- 螺 旋 值 最 小 的 是 
XP_011396011.1 成 员 成 员 ， 其 占 比 为 26.04%; 该 蛋白 三 级 结构 组 分 中 延伸 链 占 比 最 大 为 
XP_011400319.1， 达 16.22%， 其 延伸 链 最 小 占 比 为 XP_011396127.1， 达 10.40%; 该 组 分 
中 B- 转 角 值 为 3.64% (XP_011395646.1)~8.64% (XP_011398158.1); 其 结构 组 分 中 无 规则 卷 
曲 值 为 40.00% (XP_011400550.1)~54.55% (XP_011401904.1)( 表 6)。 由 此 可 推断 ， 在 原始 小 
球 藻 AP2 基因 和 蛋白 成 员 中 a- 螺旋 和 无 规则 卷曲 是 二 级 结构 的 主要 方式 , 延伸 链 和 B- 转 角 则 
分 散在 整个 基因 和 蛋白 成 员 的 氨基 酸 链 中 ( 表 5， 图 4)。 
表 5 原始 小 球 菠 AP2 和 蛋白 质 二 级 结构 元 件 含量 占 比 统计 


Table $ Statistical analysis of the content of secondary Structural elements of AP2 protein in 


Auxenochlorella protothecoides 


和 蛋白 ID o- 螺 旋 延伸 链 B- 转 角 无 规则 卷曲 
Protein ID Alphahelix (Hh) Extended strand (Ee) Beta turn (Tt) Random coil (Cc) 
XP_011395646.1 36.03% 12.96% 3.64% 47.37% 
XP_011396011.1 26.04% 14.68% 8.03% $51.25% 
XP_011396127.1 30.40% 10.40% 5.07% 54.13% 
XP_011400319.1 26.55% 16.22% 5.31% 51.92% 
XP_011401790.1 29.33% 11.14% 8.21% 51.32% 
XP_011401904.1 26.15% 10.91% 8.39% 54.55% 
XP_011400550.1 40.00% 11.80% 8.20% 40.00% 

XP 011398158.1 35.80% 10.49% 8.64% 45.06% 
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图 4 原始 小 球 菠 AP2 蛋 白质 二 级 结构 预测 分 析 


Fig.4 Prediction and analysis of secondary structure of AP2 protein in Auxenochlorella 
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蛋白 质 三 级 结构 预测 分 析 表 明 原 始 小 球 菠 AP2 家 族 蛋 和 白 成 员 均 含有 o- 螺 旋 (o-helixz)、B- 
折 闭 (B-sheet)、B- 转 角 (B-turn) 以 及 成 员 的 N 端 (N-terminal) 和 C 端 (C-terminal) 等 结构 ， 其 中 最 
主要 的 结构 是 a- 螺 旋 (a-helix)， 其 次 是 B- 折 又 (B-sheet)。 且 XP_011398158.1、XP_011400550.1 
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和 XP_011398158.1 三 个 成 员 的 三 级 结构 高 度 相似 ， 而 XP_011400319.1 和 XP_011400319.1 两 
个 成 员 的 三 级 结构 也 同样 高 度 相似 (图 5)。 
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图 5 原始 小 球 菠 AP2 和 蛋白 的 三 级 结构 预测 
Fig.3 Prediction of the tertiary Structure of AP2 protein from Auxenochlorella protothecoides 

2.6 保守 基 序 MEME 分 析 

通过 分 析 可 知 ， 在 原始 小 球 藻 AP2 转 录 因 子 家 族 的 8 个 成 员 中 ，motifl1 只 存在 于 
XP_011395646.1 和 XP_011401904.1 两 个 成 员 中 ; 除 XP_011400550.1 和 XP_011398158.1 两 个 
成 员外 ， 其 余 6 个 成 员 中 均 含 有 motif2 和 motif; 所 有 成 员 均 包含 motif3 和 motif5;，motif6 存 
在 于 XP 011395646.1 和 XP_011396011.1 两 个 成 员 中 ; motif7 存 在 于 XP_011396127.1 和 
XP_011398158.1 两 个 成 员 中 ; motif8 存 在 于 XP_011396127.1 和 XP_011401790.1 两 个 成 员 中 ; 
motif9 存 在 于 XP_011400319.1、XP_011396127.1 和 XP_011398158.1 等 3 个 成 员 中 。 该 家 族 成 
员 可 分 类 为 4 个 , 其 中 XP_011395646.1 和 XP_011396011.1 为 一 类 , 都 含有 的 是 motif2、motif3,、 
motif4、motif5、motif6 和 motif10; 第 二 类 是 XP_011400319.1 和 XP_011401904.1, 都 含有 motif3、 
motif4 和 motif5; 第 三 类 是 XP_011396127.1 和 XP_011401790.1, 都 含有 motif2、motif3、motif4 
和 motif8; 第 四 类 是 XP_011400550.1 和 XP_011398158.1， 都 含有 motif3 和 motif5。 在 原始 小 
球 藻 AP2 和 蛋白 成 员 中 ， 最 主要 含有 的 是 motif3 和 motif5，motif3 和 motif5 可 能 是 参与 植物 细胞 
生长 发 育 和 逆境 胁迫 等 多 个 生理 过 程 有 关 的 功能 基 序 (又 丽 和 余 少 明 ，2016)( 图 6， 图 7)。 
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图 6 原始 小 球 党 AP2 家 族 蛋 白 成 员 保守 基 序 分 析 


Fig.6 Conserved motif analysis of AP2 family proteins in Auxenochlorella protothecoides 
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Fig.7 Distribution of conserved motifs of AP2 protein in Auxenochlorella protothecoides 
2.7 同 源 性 比 对 及 进化 树 分 析 

将 原始 小 球 藻 的 8 个 成 员 序 列 分 别 在 plantTFDB 在 线程 序 中 ， 和 与 原始 小 球 藻 同 为 绿 菠 
门下 的 其 余 15 个 物种 4P2 基 因 家 族 的 蛋白 成 员 进行 同 源 序列 的 对 比 , 找到 相对 应 的 其 余 物种 
的 同 源 序列 ， 并 分 别 使 用 MEGA7.0 软 件 对 8 个 蛋白 成 员 序 列 组 进行 系统 进化 树 的 构建 ， 对比 
8 个 蛋白 成 员 的 同 源 序列 的 差距 ， 判 断 各 个 物种 与 原始 小 球 藻 之 间 的 亲缘 关系 。 在 
XP_011396127.1 和 XP_011396011.1 两 个 进化 树 中 亲缘 关系 最 远 的 是 金牛 介 球 菌 ， 在 
XP_011395646.1 进 化 树 中 最 远 的 是 团 藻 ， 在 XP_011400319.1 进 化 树 中 ， 最 远 的 是 盐 生 杜氏 
河 ， 在 XP_011401790.1 进 化 树 中 ， 最 远 的 是 莱茵 衣 汇 ， 在 XP_011401904.1 进 化 树 中 ， 最 远 
的 是 胶 球 藻 ， 在 XP_011400550.1 进 化 树 中 ， 最 远 的 是 深蓝 单 壳 缝 藻 ， 在 XP_011398158.1 进 
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化 树 中 ， 最 远 的 是 微 单 胞 菠 ， 根 据 此 推断 ，16 个 物种 中 与 原始 小 球 菠 亲 缘 关 系 最 远 的 是 金 
牛 介 球 菌 ， 在 XP_011395646.1、XP_011396011.1、XP_011400550.1 和 XP_011401904.1 这 4 
个 进化 树 中 都 是 螺旋 孢子 虫 与 原始 小 球 藻 的 亲缘 关系 最 近 ， 在 XP_011396127.1 和 
XP_ 011398158.1 进 化 树 中 ， 杀 缘 关 系 最 近 的 是 小 球 藻 ， 在 XP_011401790.1 进 化 树 中 ， 杂 缘 
关系 最 近 的 是 胶 球 藻 ， 在 XP_011400319.1 进 化 树 中 亲缘 关系 最 近 的 是 苦 参 3 号 ; 而 在 所 有 的 
进化 树 中 ， 小 球 藻 与 原始 小 球 藻 亲缘 关系 在 同一 大 分 支 中 一 共有 7 次 ， 苗 参 3 号 有 6 次 ， 螺 旋 
孢 子 虫 有 7 次 ， 胶 球 藻 有 3 次 ， 盐 生 杜氏 藻 有 1 次 ， 莱 茵 衣 藻 有 2 次 ， 深 蓝 单 壳 颖 藻 、 胸 状 得 
藻 和 团 藻 各 有 1 次 ， 根 据 此 推 新 ，16 个 物种 中 与 原始 小 球 藻 亲 缘 关 系 最 为 接近 的 是 小 球 藻 和 
螺旋 孢子 虫 ， 较 为 接近 的 是 苦 参 3 号 (图 8) 。 
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图 8 原始 小 球 党 AP2 和 蛋白 家 族 的 系统 发 育 树 分 析 


Fig.8 Phylogenetic tree analysis of AP2 protein family in Auxenochlorella protothecoides 
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蛋白 成 员 进 行 详细 的 生物 信息 学 分 析 后 , 可 较 详 细 的 了 解 原 
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始 小 球 藻 4P2 基 因 和 蛋白 成 员 的 各 种 特性 。 原 始 小 球 藻 中 含有 8 个 家 族 成 员 ， 而 在 拟 南 芥 
(Arabidopsis) 中 为 18 个 ( 唐 美 芳 , 2007), 水 稻 (Oryza sativa) 中 为 26 个 ( 唐 美 芳 , 2007; 施 杨 等 ， 
2013)， 玉 米 (maize) 中 为 31 个 ( 莫 晓 婷 等 ，2013)， 由 此 可 见 不 同 物种 的 AP2 家 族 蛋 白 成 员 数 
量 是 不 一 样 的 。 原 始 小 球 落 属于 植物 界 、 小 球 藻 科 、 真 核 生 物 ( 吴 丽 娟 等 ，2016)、 在 系统 进 
化 中 最 为 原始 ， 该 蛋白 家 族 成 员 含 有 247 到 715 个 氨基 酸 , 在 其 4P2 转 录 因 子 蛋 白 成 员 中 , 含 
有 多 个 保守 结构 域 , 但 是 不 存在 信号 肽 和 路 膜 结构 域 , 且 AP2 和 蛋白 的 杀 和 性 平均 值 均 小 于 0， 
故 其 为 非 分 泌 、 非 跨 膜 、 亲 水 性 型 蛋白 。 在 原始 小 球 攻 的 理化 性 质 分 析 中 , 4P2 家 族 成 员 共 
编码 3348 个 氨基 酸 ， 其 中 同时 存在 碱 性 氨基 酸 和 酸性 氨基 酸 ， 不 稳定 系数 >40， 为 不 稳定 蛋 
白 , 而 在 雷公 滕 (Tripterygium wilfordii)( 视 传 书 等 , 2018)、 茶树 (Camellia sinensis)( 吴 致 君 等 ， 
2014) 和 刺 (Ziziphus jujube)( 纪 晴 等 ，2018) 中 的 编码 氨基 酸 同 样 含 有 碱 性 氨基 酸 和 酸性 氨基 
酸 、 为 不 稳定 蛋白 ,但 茶树 含有 的 碱 性 氨基 酸 略 多 于 酸性 氨基 酸 , 旦 和 蛋白 质 残 基 为 210~290; 
而 束 的 酸性 氨基 酸 多 于 碱 性 氨基 酸 ， 这 与 本 文 研究 结果 相似 。 在 保守 结构 域 的 分 析 中 ， 不 
同 物种 的 个 数 及 位 置 不 尽 相 同 : 原始 小 球 汇 和 机 (Ziziphus jujube)( 纪 晴 等 ，2018) 的 AP2 成 员 
中 同样 存在 3 个 保守 结构 域 ， 其 中 原始 小 球 汇 的 氨基 酸 数量 跨度 最 大 达到 75， 但 野生 大 豆 
(Glycine soja)( 朱 延明 等 ，2019) 的 保守 结构 域 个 数 只 存在 两 个 ， 其 氨基 酸 数 量 跨度 较 大 达到 
104(209~313)。 在 亲 玻 水 性 分 析 中 ， 原 始 小 球 菠 AP2 成 员 蛋 白 与 菠 葛 AcPEPC 蛋白 ( 马 海洋 
等 ，2020) 和 草花 生 PEPC 基 因 家 族 ( 涂 嘉 琦 等 ，2018) 相 同 ， 所 有 有 蛋白 成 员 均 为 亲 水 性 蛋白 ， 
磷酸 化 位 点 分 析 中 ,原始 小 球 藻 AP2 和 蛋白 家 族 成 员 含 有 多 个 潜在 磷酸 化 位 点 ,最 有 可 能 的 磷 
酸化 位 点 为 丝氨酸 ,在 万 麻 (Ricinus communis)APs 分 析 中 潜在 磷酸 化 位 点 同样 为 丝氨酸 。 在 
原始 小 球 藻 的 二 级 结构 分 析 中 ， 其 二 级 结构 的 组 分 含量 从 大 到 小 排序 均 为 无 规则 卷曲 >a- 螺 
旋 > 延 伸 链 >B- 转 角 ，ou- 螺 旋 和 无 规则 卷曲 是 二 级 结构 的 主要 方式 ， 延 伸 链 和 B- 转 角 则 分 散在 
所 有 和 蛋白 成 员 的 氨基 酸 链 中 : 在 中 国 樱桃 (Chinese cherry)( 王 月 ，2017) 和 甘 昔 (Dioscorea 
esculeniag)( 阮 先 乐 等 ，2017) 中 的 二 级 结构 占 比 分 布 和 原始 小 球 菠 相同 ，o- 螺 旋 和 无 规则 卷 
占 比 最 大 ; 但 在 杨 树 (Pterocarya stenroptera)( 赵 金玲 等 ，201$) 中 ， 其 组 分 与 原始 小 球 藻 有 所 
差异 , 仅 以 无 规则 卷曲 为 主 。 在 三 级 结构 分 析 中 ,甘蓝 与 原始 小 球 藻 都 能 明显 观察 到 的 是 o- 
二 螺旋 (a-helix) 和 B- 折 对 (B-sheet)， 但 原始 小 球 汇 三 级 结构 家 族 成 员 之 间 结 构 差 异 较 大 ， 而 
A oleracea)( 郭 茵 等 ，2017) 和 甘 莫 (Dioscorea esculenta)( 阮 先 乐 等 ，2017) 的 家 族 成 
全 员 三 级 结构 基本 相似 。 在 原始 小 球 藻 保 守 基 序 中 ， 将 所 有 基 序 一 共 分 为 4 类 ， 其 中 所 有 成 员 
一 k 同 含有 的 是 motif3 和 motifg, motif3 和 motif$ 可 能 是 参与 原始 小 球 藻 乡 胞 生 4 长 发 育 和 逆境 胁 
© 迫 等 多 个 生理 过 程 有 关 的 功能 基 序 ( 采 丽 和 佟 少 明 ，2016)。 在 原始 小 球 藻 AP2 和 蛋白 家 族 中 不 
存在 信号 肽 和 跨 膜 结构 域 , 同样 在 沙 环 (ippopjpae rhamnoides)WRII 转录 因子 ( 蕊 倩 等 , 2016) 
蛋白 序列 和 著 微 科 植 物 的 19 个 DELLA 和 蛋白 ( 宋 伟 等 ，2013) 的 序列 中 也 均 无 信号 肽 和 跨 膜 结 
hs 但 同时 也 存在 不 同 ,， 例如: 在 花生 profilin 蛋 白 ( 肖 杰 等 ，2011) 序 列 中 ， 存 在 信号 肽 位 
于 第 1~24 位 蛋白 ， 却 没有 跨 膜 结构 域 ; 在 大 豆 GmANKTM 家 族 ( 柏 锡 等 ，2019) 蛋 白 中 存在 
跨 膜 结构 域 ， 在 小 麦 (ITriticum aestivum)F-box 和 蛋白 ( 王 俊 生 等 ，2013) 基 因 序 列 中 ， 第 94 至 第 
115 位 存在 一 个 可 能 的 跨 膜 区 ， 且 在 该 和 蛋白质 NN 端 序列 不 存在 信号 肽 
目前 在 植物 界 对 4P2 转 录 因 子 的 研究 主要 在 单 双 子叶 植物 上 ， 如 : 在 拟 南 芥 
(Arabidopsis)(Jofuku et al., 1994) 中 发 现 124 个 AP2/ERF 家 族 基 因 , 水 稻 (Oryza sativa)(Nakano,， 
2006) 中 发 现 了 139 个 A4P2/ERF 家 族 基 因 , 大 豆 (Glycine max) 中 发 现 了 120 个 A4P2/ERF 家 族 基 因 
(Zhang et al., 2008)， 小 兰 屿 蝴蝶 兰 (Phalaenopsis equestris) 中 发 现 了 107 个 A4P2/ERF 家 族 基 因 
等 ( 朱 光 哲 ，2016)， 而 在 藻类 上 4P2 转 录 因 子 的 研究 较 少 。 本 研究 所 主要 描述 的 是 对 原始 小 
或 AP2 所 有 各 成 员 进行 了 详细 的 生物 信息 学 分 析 , 系统 进化 分 析 结 果 说 明了 原始 小 球 藻 
最 为 原始 ， 与 原始 小 球 藻 亲缘 关系 最 远 的 是 细小 微 胞 菠 ccmp1545 (Micromonas pusilla 
CCMP1545)， 亲 缘 关 系 最 近 的 是 团 藻 (Yolvox carteri)。 本 研究 结果 为 今后 进一步 研究 A4P2 转 
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CE 


录 因 子 在 原始 小 球 藻 生 长 发 育 过 程 中 的 生理 特点 和 分 子 功能 提供 了 一 定 的 参考 依据 。 
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